SegCV : Eficient parsing of résumés with analysis and correction of errors (SegCV : traitement efficace de CV avec analyse et correction d'erreurs) [in French]

نویسندگان

  • Luis Adrián Cabrera-Diego
  • Juan-Manuel Torres-Moreno
  • Marc El-Bèze
چکیده

RÉSUMÉ Le marché d’offres d’emploi et des candidatures sur Internet a connu, ces derniers temps, une croissance exponentielle. Ceci implique des volumes d’information (majoritairement sous la forme de textes libres) intraitables manuellement. Les CV sont dans des formats très divers : .pdf, .doc, .dvi, .ps, etc., ce qui peut provoquer des erreurs lors de la conversion en texte plein. Nous proposons SegCV, un système qui a pour but l’analyse automatique des CV des candidats. Dans cet article, nous présentons des algorithmes reposant sur une analyse de surface, afin de segmenter les CV de manière précise. Nous avons évalué la segmentation automatique selon des corpus de référence que nous avons constitués. Les expériences préliminaires réalisées sur une grande collection de CV en français avec correction du bruit montrent de bons résultats en précision, rappel et F-Score.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modèle d'Evaluation des Systèmes et Ressources Applicables à la Correction d'Erreurs dans les Documents

RÉSUMÉ. L'adoption massive des services dits du Web 2.0 a entraîné une augmentation de la quantité d'informations produites. La quantité d'erreurs contenues dans ces informations a quant à elle évolué de façon plus importante. En effet, si dans un processus de production d'information classique les documents étaient issus de professionnels, dans le cadre du Web, ce sont principalement les utili...

متن کامل

Détection et correction automatique d'erreurs d'annotation morpho-syntaxique du French TreeBank (Detecting and Correcting POS Annotation in the French TreeBank) [in French]

Detecting and correcting POS annotation in the French TreeBank The quality of the Part-Of-Speech (POS) annotation in a corpus has a large impact on training and evaluating POS taggers. In this paper, we present a series of experiments that we have conducted on automatically detecting and correcting annotation errors in the French TreeBank. Two methods are used. The first simply relies on identi...

متن کامل

Playing with parsers (Jouer avec des analyseurs syntaxiques) [in French]

Résumé. Nous présentons DYALOG-SR, un analyseur syntaxique statistique par dépendances développé dans le cadre de la tâche SPRML 2013 portant sur un jeu de 9 langues très différentes. L’analyseur DYALOG-SR implémente un algorithme d’analyse par transition (à la MALT), étendu par utilisation de faisceaux et de techniques de programmation dynamique. Une des particularité de DYALOG-SR provient de ...

متن کامل

Incremental displacement-correction schemes for incompressible fluid-structure interaction

In this paper we introduce a class of incremental displacement-correction schemes for the explicit coupling of a thin-structure with an incompressible fluid. These methods enforce a specific Robin-Neumann explicit treatment of the interface coupling. We provide a general stability and convergence analysis that covers both the incremental and the non-incremental variants. Their stability propert...

متن کامل

Chronic Lymphedema and Its Treatment

L 'anatomie ct la pathologie du systeme lymphatique sont discutees a la lumieres des etudes lymphographiques. Ces etudes ont surtout demontre l'indeoendance relative des deux systemes lymphatiques superficiel et profond et lamplexite des anomalies que l'en rencontre a leur niveau. Les lymphoedeme primaires sont distangues. Les nouvel­les tec'.111iques operatoires employees pour le traitement de...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013